基于预测方法的深度学习已成为时间序列预测或预测的许多应用中的首选方法,通常通常优于其他方法。因此,在过去的几年中,这些方法现在在大规模的工业预测应用中无处不在,并且一直在预测竞赛(例如M4和M5)中排名最佳。这种实践上的成功进一步提高了学术兴趣,以理解和改善深厚的预测方法。在本文中,我们提供了该领域的介绍和概述:我们为深入预测的重要构建块提出了一定深度的深入预测;随后,我们使用这些构建块,调查了最近的深度预测文献的广度。
translated by 谷歌翻译
Many visual recognition models are evaluated only on their classification accuracy, a metric for which they obtain strong performance. In this paper, we investigate whether computer vision models can also provide correct rationales for their predictions. We propose a ``doubly right'' object recognition benchmark, where the metric requires the model to simultaneously produce both the right labels as well as the right rationales. We find that state-of-the-art visual models, such as CLIP, often provide incorrect rationales for their categorical predictions. However, by transferring the rationales from language models into visual representations through a tailored dataset, we show that we can learn a ``why prompt,'' which adapts large visual representations to produce correct rationales. Visualizations and empirical experiments show that our prompts significantly improve performance on doubly right object recognition, in addition to zero-shot transfer to unseen tasks and datasets.
translated by 谷歌翻译
在本文中,我们提出了针对无人接地车辆(UGV)的新的控制屏障功能(CBF),该功能有助于避免与运动学(非零速度)障碍物发生冲突。尽管当前的CBF形式已经成功地保证了与静态障碍物的安全/碰撞避免安全性,但动态案例的扩展已获得有限的成功。此外,借助UGV模型,例如Unicycle或自行车,现有CBF的应用在控制方面是保守的,即在某些情况下不可能进行转向/推力控制。从经典的碰撞锥中汲取灵感来避免轨迹规划,我们介绍了其新颖的CBF配方,并具有对独轮车和自行车模型的安全性保证。主要思想是确保障碍物的速度W.R.T.车辆总是指向车辆。因此,我们构建了一个约束,该约束确保速度向量始终避开指向车辆的向量锥。这种新控制方法的功效在哥白尼移动机器人上进行了实验验证。我们将其进一步扩展到以自行车模型的形式扩展到自动驾驶汽车,并在Carla模拟器中的各种情况下证明了避免碰撞。
translated by 谷歌翻译
网络值时间序列是目前的网络数据的常见形式。然而,研究由网络价值随机过程产生的网络序列的总体行为相对较少。现有的大多数研究都集中在简单的设置上,其中网络在整个时间内是独立的(或有条件独立的),并且所有边缘在每个时间步骤均同步更新。在本文中,我们研究了聚集的邻接矩阵的浓度特性以及与懒惰网络值随机过程产生的网络序列相关的相应拉普拉斯矩阵,其中边缘异步不断地更新,并且每个边缘都遵循其懒惰的随机过程,以更新独立于其更新其他边缘。我们证明了这些集中度的有用性,从而证明了标准估计器在社区估计和变更点估计问题中的一致性。我们还进行了一项仿真研究,以证明懒惰参数的影响,该参数控制时间相关的程度,对社区和变化点估计的准确性。
translated by 谷歌翻译
声学事件是具有定义明确的光谱特征的声音,可以与生成它们的物理对象相关联。声学场景是没有特定时间顺序的此类声学事件的集合。鉴于事件和场景之间的这种自然联系,一个普遍的信念是,对事件进行分类的能力必须有助于对场景的分类。这导致了几项努力,试图在声学事件标签(AET)和声学场景分类(ASC)上做得很好,使用多任务网络。但是,在这些努力中,一项任务的改进不能保证另一个任务的改善,这表明ASC和AET之间会有张力。目前尚不清楚AET的改进是否转化为ASC的改进。我们通过一项广泛的实证研究来探索这一难题,并表明在某些条件下,使用AET作为多任务网络中的辅助任务始终提高ASC的性能。此外,ASC性能进一步改善了AET数据集大小,并且对事件的选择或AET数据集中的事件数量不敏感。我们得出的结论是,ASC性能的这种改善来自使用AET的正规化效果,而不是网络提高了在声学事件之间识别的能力。
translated by 谷歌翻译
全面了解视力和语言及其相互关系至关重要,以实现这些方式与学习更广泛,有意义的陈述之间的潜在的相似之处和差异。近年来,大多数与文本到图像综合和图像到文本生成有关的作品,专注于监督生成的深层架构来解决问题,在那里在学习嵌入空间之间的相似之处非常令人兴趣方式。在本文中,我们提出了一种新颖的自我监督基于深入的学习方法,了解了学习跨模式嵌入空间的基础方法;对于图片到文本和文本到映像生成。在我们的方法中,我们首先使用基于Stackgan的AutoEncoder模型获取图像的密集矢量表示,以及利用基于LSTM的文本 - autoEncoder的句子级的密集矢量表示;然后,我们研究映射到嵌入一个模态的空间,以利用GaN和最大平均差异的生成网络嵌入其他模态的空间。我们还证明我们的模型学会从图像数据以及来自定性和定量的文本数据的图像生成文本描述。
translated by 谷歌翻译
当分布生成数据变化时,ChangePoint分析处理时间序列数据中的时间点的无监督检测和/或估计。在本文中,我们在大规模文本数据的上下文中考虑\ emph {offline} ChangePoint检测。我们在主题比例分布的分布中构建了一个专门的时间主题模型。随着该模型的完全可能性推断是在计算上难以解决的,我们开发了一个计算易诊的近似推理过程。更具体地,我们使用样品分离来首先估计多个主题,然后将似然比统计与Fryzlewicz等人的野生二进制分割算法的修改版本一起应用。 (2014)。我们的方法促进了大公司的结构变化的自动检测,而无需通过域专家手动处理。随着我们模型下的变换点对应于主题结构的变化,估计的变化点通常是高度可解释的,因为标志着时尚主题的普及涌现或下降。我们在两个大型数据集上应用我们的程序:(i)从1800-1922期(Underweet Al,2015年)的英语文学语料库; (ii)来自高能物理arxiv存储库的摘要(Clementet al。,2019)。我们获得一些历史上众所周知的改变点,发现一些新的变化点。
translated by 谷歌翻译
本文提出了一种新型数据驱动导航系统,用于在GPS拒绝,特征缺陷的环境中导航无人驾驶车辆(UV),例如隧道或矿山。该方法利用车辆可以部署和测量范围从其使本地化作为车辆穿过隧道预定路径来实现的地标。在此类方案中出现的一个关键问题是估计和减少在使命开始之前需要部署的地标数量,以便在使命开始之前,给定有关环境的一些信息。主要焦点是保持所需值的最大位置不确定性。在本文中,我们通过组合来自估计,机器学习和混合整数凸优化的技术,在GPS拒绝的功能缺陷环境中开发一种新的车辆导航系统。本文开发了一种新颖,系统的方法,用于通过环境执行本地化并通过环境导航UV,同时保持所需的本地化精度。我们还对不同情景进行了广泛的模拟实验,这些实验证实了所提出的导航系统的有效性。
translated by 谷歌翻译
Morphological neurons, that is morphological operators such as dilation and erosion with learnable structuring elements, have intrigued researchers for quite some time because of the power these operators bring to the table despite their simplicity. These operators are known to be powerful nonlinear tools, but for a given problem coming up with a sequence of operations and their structuring element is a non-trivial task. So, the existing works have mainly focused on this part of the problem without delving deep into their applicability as generic operators. A few works have tried to utilize morphological neurons as a part of classification (and regression) networks when the input is a feature vector. However, these methods mainly focus on a specific problem, without going into generic theoretical analysis. In this work, we have theoretically analyzed morphological neurons and have shown that these are far more powerful than previously anticipated. Our proposed morphological block, containing dilation and erosion followed by their linear combination, represents a sum of hinge functions. Existing works show that hinge functions perform quite well in classification and regression problems. Two morphological blocks can even approximate any continuous function. However, to facilitate the theoretical analysis that we have done in this paper, we have restricted ourselves to the 1D version of the operators, where the structuring element operates on the whole input. Experimental evaluations also indicate the effectiveness of networks built with morphological neurons, over similarly structured neural networks.
translated by 谷歌翻译